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摘 要 : 快速 监测 区 域 土壤 盐 渍 化 信息 ,对 于 盐 渍 化 治理 与 生态 环境 保护 具有 重要 意义 。 本 文 以 Sentinel-2A 和 


Landsat8 OLI 遥 感 影像 为 数据 源 , 以 银川 平原 为 研究 区 ,利用 谷歌 地 球 引擎 (Google Earth Engine,CEE ) 平 台 ,基于 随 
机 森林 算法 ,通过 建立 光谱 指数 特征 与 地 面 实测 土壤 含 盐 量 之 间 的 关系 ,进行 土壤 含 盐 量 估算 。 结 果 表 明 :CEE 能 
够 为 土壤 含 盐 量 预测 提供 可 靠 的 数据 支撑 ;以 Sentinel-2A 为 数据 源 建 立 的 随机 森林 模型 具有 更 好 的 预测 精度 (及 = 


0.789, RMSE-1.487) , 优 于 Landsat8 OLI, 可 用 于 土壤 含 盐 量 


提供 理论 支撑 。 
关键 词 : E E YE 


gm 


土壤 盐 渍 化 是 全 球 干旱 半 干 旱地 区 面临 的 重 
要 的 生态 环境 问题 。 全 世界 受 盐 碱 化 危害 的 面积 
近 10x10’hm ,中国 盐 渍 土 面 积 已 超过 3.3x10’'hm’， 
并 以 每 年 约 1.5x10'hm’ 的 速度 增加 。 受 到 全 球 
气候 变 暖 及 人 类 活动 的 影响 ,土壤 盐 渍 化 已 成 为 限 
制 农业 发 展 和 资源 可 持续 利用 的 重要 因素 ,是 导致 
土地 退化 的 主要 因素 ,严重 影响 了 区 域 生 态 环境 稳 
XE .粮食 安全 和 农业 的 可 持续 发 展 5。 因 此 ,快速 、 
精准 、 大 面积 监测 土壤 盐 溃 化 对 农业 生产 及 生态 环 
境 保护 意义 重大 "“。 

传统 监测 土壤 盐分 的 方法 耗 时 、 费 力 ,遥感 技 
术 作 为 一 种 新 的 监测 方法 , 相 比 于 传统 方法 在 进行 
大 尺度 监测 研究 方面 具有 很 大 的 优势 ,在 全 球 和 
区 域 土壤 盐 渍 化 监测 中 发 挥 着 重要 作用 …。 随 着 
遥感 技术 的 发 展 ,不 同 来 源 遥 感 数 据 为 土壤 盐 渍 化 
监测 提供 了 数据 支持 ,而 建立 土壤 盐 渍 化 信息 提取 
的 方法 ,是 快速 获取 盐 渍 化 信息 的 关键 。 近 年 来 ， 
随机 森林 算法 以 其 优越 性 ,高 效 性 稳健 性 和 精确 性 


高 分 辩 率 遥感 估算 ,能 够 为 大 太 度 土壤 含 盐 量 监测 工作 


; Google Earth Engine; 随机 森林 ; 预测 ; 银川 平原 


Landsat8 0LI 多 光谱 影像 进行 融合 ,利用 机 器 学 习 
模型 反 演 黄河 三 角 洲 地 区 土壤 盐分 ,通过 对 比 发 
现 ,随机 森林 模型 取得 较 高 的 精度 ; 张 智 揪 等 “ 借 
助 无 人 机 多 光谱 遥感 技术 监测 内 蒙古 河套 灌区 沙 
壕 渠 次 域 的 土壤 盐分 ,证 明 随 机 森林 算法 优 于 文 持 
向 量 机 算法 和 BP 神 经 网 络 算法 , 且 能 够 在 短 时 间 内 
进行 大 范围 盐分 监测 ;Fathizad $^ fs HAE BR 5) 3c 
地 测量 数据 基于 随机 和 森林 算法 预测 伊朗 中 部 沙漠 
的 土壤 盐分 时 空 分 布 ,获得 了 最 佳 的 预测 结果 。 随 
机 和 森林 模型 的 使 用 ,提升 了 人 们 对 于 土壤 盐 渍 化 变 
化 及 预测 的 精度 ,丰富 了 盐 渍 化 研究 在 时 空 方面 的 
意义 。 

在 平台 应 用 上 ,谷歌 地 球 引 擎 (Google Earth En- 
gine,GEE) 平 台 集 数 据 获取 存储、 处 理 和 分 析 于 一 
体 ,可 以 高 效 地 实现 海量 影像 数据 的 预 处 理 及 计算 
分 析 “。 国 内 外 已 经 有 专家 学 者 借助 该 平台 开展 土 
地 利用 及 农作物 分 类 算法 ”作物 产量 估算 ””、 
生物 量 估 算 ”、 水 体 及 森林 变化 动态 监测 “下 城市 


正 逐 步 应 用 于 土壤 盐分 估算 中 ,通过 建立 实测 土壤 


蔓延 等 研究 。 上 述 研究 表明 ,GEE 云 平台 可 以 高 


盐分 与 土壤 的 光谱 信息 间 复 杂 的 非 线 性 关系 ,充分 
利用 传感器 获得 的 光谱 信息 ,提高 了 估算 精度 “”。 
厉 彦 玲 等 将 环境 一 号 卫星 HSI 高 光谱 影像 与 
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效 地 实现 海量 影像 数据 的 预 处 理 及 计算 分 析 ,但 已 
有 研究 很 少 尝 试用 GEE 云 平台 进行 土壤 盐分 的 
估算 。 
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基于 随机 森林 算法 估算 精度 高 ,GEE 云 平台 高 
效 的 优势 ,在 GEE 云 计算 平台 ,使 用 该 平台 自 带 的 
JavaScript API £t ££ 2g $8 8$ ( https://code.earthengine. 
google.com/) 编 程 ,以 宁夏 银川 平原 为 例 , 利 用 Senti- 
nel-2A 和 Landsat8 OLI 卫 星 遥 感 影 像 ,基于 光谱 指 
数 建立 随机 森林 模型 ,估算 土 壤 含 盐 量 (Soil salt 
content, SSC) ,以 期 丰富 随机 森林 算法 和 GEE 云 平 
台 在 土壤 盐 渍 化 监测 中 的 应 用 ,为 灌区 土壤 盐 渍 化 

言 息 的 准确 预测 和 监测 提供 技术 支持 。 


1 研究 区 概况 与 数据 来 源 


1.1 研究 区 概况 

银川 平原 (37.83”~39.38”N, 104.28°~107.65°E) 
地 处 宁夏 回族 自治 区 北部 (图 1) ,南北 长 约 165 km, 
东西 宽 10~50 km, 面 积 约 7615 km:。 该 区 地 处 黄河 
灌溉 中 上 游 ,处 于 贺兰山 东 药 的 洪 积 扇 与 平原 之 
间 ,是 黄河 流域 生态 保护 和 高 质量 发 展 的 先行 区 ， 
更 是 西北 和 干旱 与 半 和 干旱 地 区 土壤 盐 渍 化 的 典型 样 
区 。 人 研究 区 属于 温带 干旱 区 ,具有 了 上 暧 温 带 季 风气 
候 , 年 平均 气温 9 'C, 年 均 降 水 量 在 150~203 mm ,年 
日 照 时 数 2500~3100 h, 4E352€ Z 521825 mm。 银 
川 平原 主要 是 由 冲 湛 积 平 原 构 成 ,地 势 低 注 .排水 
条 件 差 .地 下 水 埋 深浅 2E WR 水 盐分 集中 、 地 热 
高 灌溉 不 合理 ,是 宁夏 土壤 盐 渍 化 最 严重 的 地 区 

一 。 主 要 作物 有 水 稳 、 小 麦 EX. 
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1.23 土壤 盐分 数据 获取 

本 文 以 5 kmx5 km 的 格 网 设置 采样 点 ,采样 时 
每 个 样 点 采用 梅花 形 采 样 法 ,在 采样 点 30 mx30 m 
范围 内 ,采集 0~20 cm 土壤 混 匀 ,运用 四 分 法 留 约 
500 g 土 壤 样品 装 进 密封 袋 带 回 , 同 时 记录 采样 点 的 
编号 .坐标 信息 .土地 利用 植被 长 势 等 信息 。 土 壤 
样品 采集 于 2021 年 3 月 和 2022 年 4 月 ,2021 年 采集 
166 个 样 点 ,2022 年 采集 133 个 样 点 , 共 采 集 299 个 
样 点 (图 1)。 将 所 有 土壤 样本 剔除 荒草 和 碎 石 块 等 
杂质 后 自然 风干 ,研磨 后 过 2 mm 筛 ,以 水 土 比 5:1 
配置 提取 液 , 用 电导 率 法 ”测算 含 盐 量 ,删除 异常 
样 点 后 得 到 0~20 cm 表层 土壤 样本 共 297 份 。 
1.3 数据 处 理 

为 消除 不 同 指标 之 间 维 度 的 影响 ,通过 CEE 云 
平台 调用 normalization 函数 ,将 数据 进行 归 一 化 处 
理 ,将 所 有 输入 数据 归 一 化 到 0~1, 归 一 化 公式 为 : 


pai in (1) 

X max C min 
AP: x 为 该 点 实测 样本 值 ; x,, 为 最 小 样本 ; x,、 
为 最 大 样本 ;max 和 min 是 给 定 缩放 范围 的 最 天 人 


和 最 小 值 ; x; 为 归 一 化 后 的 数据 。 
14 遥感 影像 获取 与 处 理 

人 研究 使 用 的 Landsat8 OLI Level-2 和 Sentinel-2 
Level-2A 地 表 反 射 率 数 据 来 源 于 GEE 云 平台 (https: 
数据 基准 面 为 
WGS84, 地 图 投影 为 UTM 投影 ,Landsat8 OLI 的 空间 


//code.earthengine.google.com/) 。 


NE 
入 2021 年 采样 点 
| 2922 年 采样 点 
区 EN] Am 
= 裸 地 
= 草地 
一 耕地 
um 水 域 
um 有 林地 
um 城镇 用 地 


图 1 研究 区 位 置 和 采样 点 分 布 


Fig. 1 Location and distribution of sampling points of study area 
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分 辨 率 为 30 m,Sentinel-2A 的 空间 分 辩 率 为 10 m, 
38 FH filter 函数 筛选 云 量 小 于 10% 的 影像 。 数 据 经 
过 几何 校正 .辐射 校正 和 大 气 校正 。 由 于 数据 中 均 
集成 了 用 于 影像 质量 评估 的 QA 波 段 ,利用 QA 波 段 
提供 的 云 掩 膜 信 息 可 进行 遥感 影像 的 去 云 操作 。 

影像 成 像 时 间 范 围 分 别 设置 为 2021 年 3 月 1 一 
31 日 和 2022 年 4 月 1 一 30 日 ,与 野外 采样 时 间 相 对 
应 。 由 于 在 GEE SFA ETT SE D BER D ERR PE 
易 出 现 影 像 重 又 和 不 连续 的 问题 , 故 根据 设 定 的 时 
间 范 围 , 调 用 median 函数 计算 影像 集 的 中 位 数 ,筛选 
与 该 中 位 数 影像 差异 最 小 的 影像 进行 镶 艇 。 最 
后 ,选择 影像 中 的 Blue、Green、Red、NIR、SWIR1 和 
SWIR2 六 个 常用 的 波段 进行 影像 波段 合成 ,在 合成 
影像 上 利用 研究 区 矢量 边界 裁剪 得 到 人 研究 区 影像 
数据 ,以 上 操作 均 基 于 GEE 云 平台 通过 JavaScript 语 
言 实 现 。 


2 研究 方法 


2.1 光谱 指数 选取 

在 十 旱 半 干旱 地 区 ,光谱 指数 是 监测 土壤 盐 污 
化 的 有 效 方法 吕 。 已 有 研究 表明 ,学 者 们 在 选取 光 
谱 指 数 时 ,常用 的 是 植被 指数 和 盐分 指数 。 由 于 植 
被 指数 难以 准确 反映 稀 玻 植被 地 区 的 光谱 信息 , 基 
于 此 产生 了 诸多 基于 植被 指数 与 盐分 指数 组 合 反 
演 土 壤 盐 溃 化 的 研究 ”i。 考 虑 到 研究 区 处 于 干旱 
半 干 旱 区 ,本 文 综合 了 植被 指数 和 盐分 指数 两 种 光 
谱 指 数 。 盐 分 指数 包括 :SI_T、SIl、SI2、SI3、SI4、 
SI5、S1、S2、S3、SAIO、CRSI; 植 被 指数 包括 :SAVI.、 
GDVI。 各 光谱 指数 公式 如 表 1 所 示 。 

本 人 研究 基于 人 研究 区 影像 ,通过 GEE 云 平台 调用 
get Index 函数 构建 光谱 指数 ,选择 红 波 段 (Red) 、 绿 
i Bt (Green) 、 蓝 波段 (Blue) 和 近 红 外 波段 (NIR), 按 
照 计算 公式 ,进行 各 类 光谱 指数 的 计算 和 提取 3， 
本 文 进行 光谱 指数 提取 操作 程序 代码 均 在 GEE 云 
平台 在 线 代 人 码 编辑 器 中 用 JavaScript 编 写 。 
2.2 敏感 光谱 参数 筛选 

因 自 变量 之 间 存 在 共 线 性 问题 ,直接 输入 较 多 
的 变量 建 模 会 因 样 本 数据 之 间 的 微小 差异 导致 回 
归 方 程 的 回归 系数 出 现 误差 ,从 而 降低 模型 的 稳定 
性 ,在 一 定 程度 上 会 影响 建 模 精度 “。 为 了 消除 输 
入 变量 过 多 和 多 重 共 线性 在 建 模 过 程 中 带 来 的 不 


表 1 光谱 指数 计算 公式 


Tab.1 The calculation formula of spectral indexes 


光谱 指数 计算 公式 参考 文献 
盐分 指数 (SIL_T) (Red-NIR)x100 35] 
盐分 指数 1(SI1) VGreen X Red 36] 
盐分 指数 2(SI2 ) Y Green? + Red? + NIR? 36] 
盐分 指数 3(SI3 ) JGreem + Red? 37] 
盐分 指数 4(SI4) (BluexRed)/Green 38] 
盐分 指数 5(SI5) (Green+Red)/2 39] 
盐 渍 化 指数 1(S1) Blue/Red 38] 
盐 渍 化 指数 2(S2 ) (Blue-Red)Blue+Red) 38] 
盐 渍 化 指数 3(S3 ) (GreenxRed)Blue 38] 
盐 度 比值 指数 (SAIO ) (Red-NIR)/(Green+NIR) 40] 
MEHR AV a 
绿 度 差 值 植被 指数 (GDVI) |. (NIR- Red? (NIR^HRed) 42] 
和 冠 层 响应 盐 度 指数 (CRSID) INIR x Red)-(Green x Blue)]/[43] 


| 
J [(NIR x Red) + (Green x Blue)] 


利 影 响 , 本 文 基于 R 软件 (版 本 4.1.3), 利 用 R 语 言 
中 的 Hmisc 程 序 包 中 的 cor 函数 进行 不 同 数据 源 下 
SSC 与 13 个 光谱 参数 的 Pearson 相关 性 分 析 和 显著 
TER dS, 
2.3 土壤 盐 渍 化 反 演 模型 
2.3.1 随机 森林 模型 构建 ”随机 森林 的 核心 思想 是 
对 训练 集 进行 自助 采样 ,组 成 多 个 训练 集 ,每 个 训 
练 集 生成 一 棵 决策 树 ,所 有 决策 树 组 成 随机 和 森林， 
从 而 对 样本 进行 训练 并 预测 的 机 器 学 习 算 法 和。 
该 方法 将 多 个 决策 树 组 合 起 来 以 创建 随机 森林” ， 
步骤 如 下 : 

步骤 1: 首 先 从 训练 样本 集 D={(xsy)， Go, 
yi). (sy 中 ,随机 产生 N DIERE S,,S., … ， 
Suo 

步骤 2: 对 每 个 训练 集 生 成 对 应 的 决策 树 A， 
太太 ; 在 对 每 个 非 叶 节点 上 选择 属性 前 ,从 全 部 
M 个 属性 中 随机 抽取 m 个 (m< <M) 作 为 当前 节点 
的 分 裂 属 性 集 ,并 从 中 选择 出 一 个 最 佳 分 割 属性 作 
为 节点 进行 分 裂 ; 

步骤 3: 将 生成 的 多 棵 决策 树 构成 随机 森林 ,对 
于 测试 集 样本 和 ,利用 每 棵 决策 树 进行 测试 ,根据 公 
式 得 到 预测 结果 f(x),f(x),…… ,f(x), 根 据 参 考 文献 
[47], 预 测 公 式 如 下 : 


TO DAAG 2) 
式 中 :表示 N 个 A(q) 的 集合 :td) 表 示 随 机 森林 模 
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型 的 预测 结果 ;f(x) 表 示 单 个 决策 树 的 预测 结果 。 

本 文通 过 GEE 云 平 台 调 用 ee.Classifier.smile- 
RandomForest 函数 实现 模型 回归 预测 ,模型 的 效果 
通过 决策 树 的 数量 n 和 结 点 使 用 的 特征 数 m 两 个 参 
数 来 调整 。 决 策 树 数 量 过 多 会 影响 模型 效率 ,过 少 
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和 S3 均 通过 0.01 显著 性 检验 ,S1.S2 和 CRSI 均 通过 
0.001 显著 性 检验 ,上 且 S2 与 SSC 的 系数 最 大 ,表明 光 
谱 指 数 SLT\SI2 SIB S1.S2.S3 和 CRSI 具 有 较 强 的 
相关 性 ,可 用 于 土壤 盐分 模型 的 构建 。 在 以 Senti- 
nel-2A 为 数据 源 计 算 的 光谱 指数 中 ,所 有 光谱 指数 


则 影响 模型 精度 ,因此 在 权衡 决策 树 数 量 并 兼顾 精 
度 和 效率 的 同时 ,通过 试验 确定 决策 树 数量 为 100， 
将 结 点 使 用 的 特征 数 设置 为 默认 值 , 即 输入 特征 总 
数 的 平方 根 。 

2.3.2 模型 评价 指标 “为 量化 土壤 盐分 反 演 模型 的 
预测 效果 ,利用 GEE 云 平台 计算 并 输出 两 个 常用 指 
标 决 定 系 数 ( 尼 ) 和 均 方 根 误差 (RMSE ) 来 进行 综合 
评价 。 尼 越 接近 于 1 , 均 方 根 误 益 RMSE 越 小 , 则 模 
型 拟 合 效果 越 好 ,预测 效果 越 佳 3。 


3 结果 与 分 析 


3.1 土壤 盐分 统计 特征 

参考 布雷 迪 的 分 级 方法 沁 ,将 297 份 土 样 根据 
盐分 含量 将 样本 的 盐 渍 化 程度 分 为 5 个 等 级 ,样本 
的 描述 性 统计 分 析 如 表 2 所 示 。 由 表 2 可 知 ,不 同 
盐 渍 化 程度 土壤 样本 数量 大 体 均 匀 ,土壤 样本 含 盐 
量 总 体 变异 系数 超过 138% ,变异 性 较 强 ,表明 样本 
离散 程度 较 高 ,具有 普 适 性 。 将 土壤 样本 按 含 盐 量 
由 低 到 高 排序 ,按照 2:1 的 比例 等 间隔 选取 198 个 
样本 作为 训练 集 建立 反 演 模型 ,其 余 99 个 作为 验证 
集 , 用 于 检验 反 演 模型 "5。 
32 土壤 盐分 与 光谱 指数 相关 性 分 析 

利用 R 语 言 中 的 GGally 和 ggplot2 程序 包 绘 制 
不 同 数据 源 下 SSC 与 13 个 光谱 参数 的 相关 和 矩阵 网 
(图 2) ,基于 通过 0.01 显著 性 检验 的 敏感 光谱 参数 
建 模 。 图 2 显示 ,在 以 Landsat8 OLI 为 数据 源 计 算 的 
光谱 指数 中 ,除了 SI4 SAIO FI GDVII, 其余 光 谱 指 数 
与 土壤 含 盐 量 均 具有 较 强 的 相关 性 ,SLT、SI2 S13 


与 土壤 含 盐 量 均 具 有 较 强 的 相关 性 ,SIL .SI3 .SI5、 
SAIO SAVI 和 GDVI 均 通过 0.01 显著 性 检验 ,SLT、 
SI2、S1、S2、S3 和 CRSI 均 通过 0.001 显著 性 检验 , 表 
WjSI T,SI2,S1,S2,S3 FI CRSI E SSC 有 较 强 的 相关 
性 , 故 选 择 SIL, SI2, SIB, SIS, SATIO, SAVI, GDVI, 
SI. T, S1,S2,53 和 CRSI 用 于 以 Sentinel-2A 为 数据 
源 的 模型 构建 。 
3.3 模型 构建 

基于 随机 森林 模型 ,以 土壤 含 盐 量 为 输出 层 ， 
在 以 Landsat8 OLI 为 数据 源 建立 的 模型 中 ,选取 
SI. T, SI2, SI3, S3, S1, S2 和 CRSI 为 输入 层 数据 ;在 
VJ Sentinel-2A 为 数据 源 建 立 的 模型 中 ,选取 SI1、 
SI2 .SI3 SI5 , SAIO, SAVI,GDVI,SI, T,51,S2, S3 和 
CRSI 为 输入 层 数据 ,分 别 对 土壤 盐分 含量 进行 模 
拟 ,结果 如 表 3 所 示 。 由 表 3 可 知 ,以 Sentinel-2A 建 
立 的 模型 的 忆 值 较 以 Landsat8 OLI 建立 的 模型 大 ， 
且 RMSE 小 ,表明 以 Sentinel-2A 为 数据 源 建立 的 土 
坏 盐 分 预测 模型 较 优 。 

利用 99 个 验证 数据 对 模型 进行 验证 ,结果 如 图 
3。 图 3 表明 以 两 种 数据 源 建立 模型 ,预测 值 与 实测 
值 均 具 有 良好 的 相关 性 ,其 中 以 Sentinel-2A 为 数据 
源 建立 随机 森林 模型 的 尺 更 大 , 且 RMSE 更 小 ,表明 
以 Sentinel-2A 为 数据 源 建 立 的 土壤 盐分 随机 森林 
预测 模型 精度 优 于 以 Landsat8 0LI 为 数据 源 建立 的 
预测 模型 。 
3.4 土壤 盐 渍 化 预测 

利用 以 Sentinel-2A 为 数据 源 建 立 的 土壤 盐分 
随机 森林 预测 模型 ,对 银川 平原 土壤 盐 渍 化 进行 预 


R2 银川 平原 土壤 样本 统计 


Tab.2 Soil salinization degree and sample statistics in Yinchuan Plain 


盐 渍 化 等 级 含 盐 量 /g'kg ) ”样本 数量 ” 含 盐 量 均值 Mg'kg ) 含 盐 量 最 大 值 (g.kg ) 含 盐 量 最 小 值 (g.kg) ”变异 系数 /% 
非 盐 渍 化 <1 91 0.56 0.98 0.09 39.79 
轻 度 盐 渍 化 1-2 64 1.46 1.96 1.00 20.09 
中 度 盐 渍 化 2-4 55 2.82 3.97 2.00 19.42 
重度 盐 渍 化 4-6 37 4.90 5.91 4.06 11.97 
il >6 50 12.00 20.74 6.14 35.10 
总 样本 297 3.63 20.74 0.09 138.76 
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注 :(1)* 表 示 显 著 性 检验 P«0.05 ,**# 表 示 显 著 性 检验 P<0.01,*#*#* 表 示 显 著 性 检验 P«0.001; (2) 左下 区 为 土壤 含 盐 量 (SSC ) 与 13 个 光谱 参数 的 


两 两 关系 散 点 图 ,右上 区 为 对 应 的 相关 系数 值 ,中 间 斜 对 角 为 对 应 横 轴 上 


的 核 密度 估计 


图 ;(3) 图 中 不 同 颜色 代表 不 同 数据 源 , 蓝 色 代 表 以 


Landsat8 OLI 为 数据 源 计 算得 出 的 相关 系数 ,绿色 代表 以 Sentinel-2A 为 数据 源 计 算得 出 的 相关 系数 。 
图 2 光谱 指数 与 土壤 盐分 的 相关 性 


Fig.2 Correlation between spectral indexes and soil salinity 


表 3 基于 不 同 数据 源 的 随机 森林 模型 


Tab.3 Random forest model based on 


different data sources 


. 建 模 集 (n=198) 验证 集 (n=99) 
数据 源 - - 
R RMSE R RSME 
Landsat8 OLI 0.615 3.169 0.734 1.698 
Sentinel-2A 0.633 2.875 0.789 1.487 


测 , 按 


照 盐 活 化 程度 对 预测 结果 进行 分 级 和 统计 ， 


结果 如 图 4 和 表 4。 由 图 4 可 知 ,银川 平 原 土壤 盐分 
总 体 上 呈现 南 轻 北 重 的 分 布 格局 ,原因 可 能 是 平原 
地 势 南 高 北 低 ,黄河 流向 自 南 向 北 ,北部 地 下 水 埋 
深浅 .盐分 极 易 积 累 于 土壤 表层 , 盐 土 主要 集中 分 
布 在 平原 北部 的 平 罗 县 西 侧 、 大武 口 区 和 惠 农 区 , 
占 盐 土 总 面积 的 89.85%。 南 部 作为 黄河 人 水 口 携 
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图 3 土壤 盐分 与 模型 预测 值 的 散 点 图 


Fig.3 The scatter plot of soil salinity and model predictions value 


图 4 土壤 含 盐 量 反 演 等 级 分 布 


Fig. 4 Grade distribution of soil salinity inversion 


RA 银川 平原 不 同等 级 盐分 反 演 像 元 数 及 占 比 
Tab.4 Number and proportion of inversion pixels of 


different grades of salinity in Yinchuan Plain 


盐 渍 化 等 级 像 元 数 MFR/km? 占 比 /% 
非 盐 渍 化 29115098 2916.701 41.620 
轻 度 盐 渍 化 23348676 2332.925 33.290 
中 度 盐 渍 化 10886719 1086.069 15.498 
重度 盐 渍 化 5121100 511.611 7.301 
il 1609153 160.567 2.291 


傍 盐 基 离 子 外 流 ,土壤 积 盐 较 少 ， piper 
盐 溃 化 土壤 集中 分 布 在 平原 南部 的 金 风 区 、 兴 庆 
区 、 永 宁县 、 灵 武市 青 ee 占 银川 平 
原 总 面积 的 71.59%。 盐 渍 化 预测 结果 与 实际 采样 
情况 较为 一 致 ,表明 随机 森林 模型 可 用 于 该 区 土壤 
盐分 预测 。 


4 讨论 


利用 从 卫星 影像 的 各 波段 计算 土壤 光谱 指数 
已 成 为 监测 土壤 盐 渍 化 空间 分 布 的 最 常用 方法 ” ， 
多 数学 者 使 用 来 自卫 星 数据 可 见 光波 段 的 土壤 光 
谱 指数 ,并 选择 与 地 面 测 量 数 据 具有 较 高 相关 性 的 光 
谱 指数 作为 建立 模型 的 输入 变量 , 均 得 到 了 较 好 的 预 
测 结果 ,表明 建立 光谱 指数 在 土壤 盐分 监测 应 用 方面 
具有 一 定 的 优势 ””。 目 前 ,常用 的 建 模 方案 有 两 
种 :一 是 直接 使 用 盐分 指数 估算 土壤 含 盐 量 ;二 
是 利用 植被 指数 间接 估算 土壤 售 盐 量 ”。 但 为 了 
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更 加 精确 地 监测 土壤 盐 渍 化 ,必须 考虑 盐 和 后 植物 的 光谱 — sat8 OLI 为 数据 源 建立 的 随机 森林 模型 。 


反射 率 ,特别 是 在 盐 碱 化 严重 的 干旱 和 半 干 旱地 区 。 
鉴于 此 ,本 文 综合 考虑 了 盐分 指数 和 植被 指数 , 通 
过 Landsat8 OLI FI Sentinel-24A 的 可 见 光 波段 和 a 
外 波段 信息 建立 多 个 光谱 指数 与 盐分 实测 值 进 
相关 性 分 析 , 使 用 随机 森林 算法 建立 回归 模型 监 涡 
盐 渍 土 的 空间 分 布 ,并 在 CEE 平台 上 生成 其 结果 。 
与 常用 的 线性 回归 分 析 土 壤 盐分 分 布 的 方法 相 比 ， 
机 器 学 习 算 法 能 够 对 土壤 盐 渍 化 空间 分 布 提 供 更 

加 可 靠 的 预测 效果 ,尤其 是 在 实地 测量 数据 有 限 的 


情况 下 字 。 而 且 与 其 他 机 器 学 习 算法 相 比 ,随机 森 
林 算 法 能 够 更 准确 地 预测 盐 渍 化 土地 的 土壤 盐分 
分 布 情况 1。 

但 当前 研究 还 具有 许多 不 确定 性 ,主要 有 两 个 


来 源 : 一 是 土壤 盐分 特征 与 遥感 数据 之 间 关 系 的 不 
确定 性 。 由 于 土壤 盐 渍 化 的 机 制 相当 复杂 ,通过 卫 
et a ee 
土壤 表面 粗糙 度 和 其 他 土壤 特性 的 影响 ”。 其 根 
usi b d 息 获 取 方 面 存在 先天 缺 
能 表达 出 土壤 的 定性 指标 。 此 外 ,虽然 遥感 
su. 笃 过 辐射 校正 和 大 气 校正 ,但 捕获 的 光谱 信 
息 仍 可 能 受到 地 形 因素 的 影响 。 二 是 建立 随机 森 
林 模 型 时 的 不 确定 性 ,对 于 机 咒 学 习 模型 来 说 , 数 
据 集 的 质量 和 数量 对 模型 的 预测 结果 有 很 大 的 影 
响 , 本 研究 中 样本 量 (n=297) 相 对 较 小 ,这 可 能 会 在 
建立 随机 和 森林 模型 时 产生 不 确定 性 。 因 此 ,本 文 所 
建立 的 估算 模型 能 否 运 用 到 其 他 地 区 还 有 待 进 
步 的 研究 和 验证 。 


5 结论 


在 本 人 研究 中 ,通过 比较 Landsat8 OLI 和 Senti- 
nel-2A 图像 的 光谱 特征 ,并 利用 两 幅 不 同 遥 感 影像 
建立 随机 森林 模型 研究 对 比 了 土壤 含 盐 量 的 预测 
VERE , 主要 研究 结果 如 下 : 

(1) 利用 GEE 云 计算 平台 提供 的 来 自 不 同 传 感 
器 的 大 量 分 析 数 据 和 算法 ,有 助 于 准确 估计 研究 区 
的 土壤 盐分 分 布 情况 ,促进 大 规模 区 域 土壤 盐分 监 
测 工作 的 进行 。 

(2) 基于 Sentinel-2A 数据 建立 的 随机 森林 模型 
表现 出 了 较 好 的 预测 精度 和 模型 性 能 (R=0.789， 
RMSE-1.487) ,土壤 含 盐 量 预 测 结果 优 于 以 Land- 


(3) 利用 基于 Sentinel-2A 数据 的 随机 森林 模型 
对 银川 平原 空间 范围 内 土壤 盐分 进行 预测 ,预测 结 
果 与 实地 采样 情况 具有 较 好 的 一 致 性 。 表 明 以 Sen- 
tinel-2A 为 数据 源 建立 的 随机 森林 模型 可 用 于 土壤 
盐 渍 化 预测 。 
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Prediction of soil salt content based on the random forest algorithm 


LI Xiaoyu, JIA Keli, WEI Huimin, CHEN Ruihua, WANG Yijing 
(College of Geographical Sciences and Planning, Ningxia University, Yinchuan 750021, Ningxia, China) 


Abstract: Soil salinization caused by natural and anthropogenic factors is an environmental hazard that is 
especially important in arid and semi-arid regions of the world. The accumulation of salts in soil is a major threat 
to crop production and global agriculture. Therefore, the rapid and precise detection of salt- affected lands is 
highly critical for sustaining soil productivity. This paper aims to analyze the performance of the random forest 
algorithm in mapping soil salinity in the Yinchuan Plain using Landsat-8 OLI, Sentinel-24A satellite images, and 
ground-based soil salt content (SSC) measurements with the aid of the Google Earth Engine (GEE) platform. We 
estimated SSC by establishing the relationship between spectral index characteristics and ground-measured soil 
salt content. The results show that GEE can provide reliable data support for soil salinity prediction. The random 
forest model established with Sentinel-2A as the data source performed better (R^ — 0.789, RMSE - 1.487) than 
and can therefore be used for the estimation of soil salinity using high-resolution remote sensing, which can 
provide theoretical support for large-scale soil salinity monitoring. 


Keywords: soil salt content; Google Earth Engine; random forest; predict; Yinchuan Plain 


